Reading comprehension of legal text can be a particularly challenging task due to the length and complexity of legal clauses and a shortage of expert-annotated datasets. To address this challenge, we introduce the Merger Agreement Understanding Dataset (MAUD), an expert-annotated reading comprehension dataset based on the American Bar Association's 2021 Public Target Deal Points Study, with over 39,000 examples and over 47,000 total annotations. Our fine-tuned Transformer baselines show promising results, with models performing well above random on most questions. However, on a large subset of questions, there is still room for significant improvement. As the only expert-annotated merger agreement dataset, MAUD is valuable as a benchmark for both the legal profession and the NLP community.
translated by 谷歌翻译
我们实施和解释各种有涉及实际二次领域的监督学习实验,具有1、2和3。我们从数据科学的角度量化了匹配/不同奇偶校验的类别的相对困难,应用功能分析的方法论组件分析,并使用符号分类来开发适用于我们数据集的1、2和3类的机器学习公式。
translated by 谷歌翻译
在这项工作中,我们介绍了患者生成的含量中第一个用于德国不良药物反应(ADR)检测的语料库。该数据包括来自德国患者论坛的4,169个二进制注释的文档,用户谈论健康问题并从医生那里获得建议。正如该领域的社交媒体数据中常见的那样,语料库的类标签非常不平衡。这一主题不平衡使其成为一个非常具有挑战性的数据集,因为通常相同的症状可能会有几种原因,并且并不总是与药物摄入有关。我们旨在鼓励在ADR检测领域进行进一步的多语性努力,并使用基于多语言模型的零和少数学习方法为二进制分类提供初步实验。当对XLM-Roberta进行微调首先在英语患者论坛数据上,然后在新的德国数据上进行微调时,我们的正面级别的F1得分为37.52。我们使数据集和模型公开可供社区使用。
translated by 谷歌翻译
布料的机器人操作的应用包括织物制造业到处理毯子和洗衣。布料操作对于机器人而言是挑战,这主要是由于它们的高度自由度,复杂的动力学和折叠或皱巴巴配置时的严重自我闭合。机器人操作的先前工作主要依赖于视觉传感器,这可能会对细粒度的操纵任务构成挑战,例如从一堆布上抓住所需数量的布料层。在本文中,我们建议将触觉传感用于布操作;我们将触觉传感器(Resin)连接到弗兰卡机器人的两个指尖之一,并训练分类器,以确定机器人是否正在抓住特定数量的布料层。在测试时间实验中,机器人使用此分类器作为其政策的一部分,使用触觉反馈来掌握一两个布层,以确定合适的握把。实验结果超过180次物理试验表明,与使用图像分类器的方法相比,所提出的方法优于不使用触觉反馈并具有更好地看不见布的基准。代码,数据和视频可在https://sites.google.com/view/reskin-cloth上找到。
translated by 谷歌翻译
发现采用时间分离技术(TST)的基于模型的重建可以使用C臂锥束计算机断层扫描(CBCT)改善肝脏的动态灌注成像。要使用从CT灌注数据中提取的先验知识应用TST,应从CT扫描中准确分割肝脏。需要对主要和基于模型的CBCT数据进行重建,以正确可视化和解释灌注图。这项研究提出了Turbolift Learning,该学习按照培训CT,CBCT,CBCT,CBCT TST的顺序训练多尺度关注的多尺度注意力,UNET串行序列上的不同肝脏细分任务 - 使先前的培训作为前培训作为预训练阶段的阶段随后的问题 - 解决培训数据集数量有限的问题。对于CBCT TST的肝脏分割的最终任务,提议的方法的总骰子得分为0.874 $ \ pm $ 0.031和0.905 $ \ pm $ \ $ \ $ 0.007,分别为6倍和4倍的交叉验证实验 - 获得统计上显着的改进 - 在模型上,该模型仅接受该任务。实验表明,涡轮增压不仅提高了模型的整体性能,而且还使其与源自栓塞材料和截断物品的人工制品具有稳健性。此外,深入分析确认了分割任务的顺序。本文显示了从CT,CBCT和CBCT TST分割肝脏的潜力,从可用的有限培训数据中学习,将来可能会用于可视化和评估灌注图的肝病评估。 。
translated by 谷歌翻译
在自拍照上的增强现实或AR过滤器在社交媒体平台上已经非常受欢迎,用于各种应用程序,包括营销,娱乐和美学。鉴于AR面部过滤器的广泛采用以及面孔在我们的社会结构和关系中的重要性,科学界从心理,艺术和社会学的角度分析此类过滤器的影响增加了。但是,该领域的定量分析很少,这主要是由于缺乏具有应用AR过滤器的面部图像的公开数据集。大多数社交媒体平台的专有性,紧密的性质不允许用户,科学家和从业人员访问代码和可用AR面孔过滤器的详细信息。从这些平台上刮擦面孔以收集数据在道德上是不可接受的,因此应在研究中避免。在本文中,我们介绍了OpenFilter,这是一个灵活的框架,可在社交媒体平台上使用AR过滤器,可在现有的大量人体面孔上使用。此外,我们共享FairBeauty和B-LFW,这是公开可用的Fairface和LFW数据集的两个美化版本,我们概述了这些美化数据集的分析得出的见解。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
变压器已成为机器学习的重要主力,并具有许多应用。这需要开发可靠的方法来提高其透明度。已经提出了多种基于梯度信息的多种可解释性方法。我们表明,变压器中的梯度仅在本地反映该函数,因此无法可靠地确定输入特征对预测的贡献。我们将注意力头和分层确定为这种不可靠的解释的主要原因,并提出了通过这些层传播的一种更稳定的方式。我们的建议在理论上和经验上都显示出良好的LRP方法的适当扩展,以克服简单基于梯度的方法的缺乏,并实现先进的解释绩效在广泛的变压器模型和数据集上。
translated by 谷歌翻译
组合演变 - 通过现有物品的组合创建新事物 - 可以是发展而不是设计电子电路等技术对象的强大方法。有趣的是,这似乎是一个持续的,因此开放的过程,创造了越来越复杂性的新奇。在这里,我们采用了软件开发的组合演变。虽然遗传编程等当前方法在解决特殊问题方面是有效的,但它们都会趋向于解决方案,并且之后不再创建任何新的东西。多种式语言和技术等复杂系统的组合演变被认为是开放式的。因此,通过组合演化可能可以进行开放式自动编程。我们实现了一种计算机程序,模拟存储在数据库中的代码块的组合演进,以使它们可用于组合。通过评估正则表达式来实现基于算法的码代生成感的自动编程。我们发现编程语言的保留关键字适用于在仿真开始时定义基本代码块。我们还发现占位符可用于组合代码块,并且可以根据对编程语言的重要性来描述代码复杂性。与电子电路的先前组合演进仿真一样,复杂性从简单的关键字和特殊字符增加到更复杂的变量声明,类定义,方法和包含方法和变量声明的类。因此,组合演化似乎是开放式自动编程的有希望的方法。
translated by 谷歌翻译
View-dependent effects such as reflections pose a substantial challenge for image-based and neural rendering algorithms. Above all, curved reflectors are particularly hard, as they lead to highly non-linear reflection flows as the camera moves. We introduce a new point-based representation to compute Neural Point Catacaustics allowing novel-view synthesis of scenes with curved reflectors, from a set of casually-captured input photos. At the core of our method is a neural warp field that models catacaustic trajectories of reflections, so complex specular effects can be rendered using efficient point splatting in conjunction with a neural renderer. One of our key contributions is the explicit representation of reflections with a reflection point cloud which is displaced by the neural warp field, and a primary point cloud which is optimized to represent the rest of the scene. After a short manual annotation step, our approach allows interactive high-quality renderings of novel views with accurate reflection flow. Additionally, the explicit representation of reflection flow supports several forms of scene manipulation in captured scenes, such as reflection editing, cloning of specular objects, reflection tracking across views, and comfortable stereo viewing. We provide the source code and other supplemental material on https://repo-sam.inria.fr/ fungraph/neural_catacaustics/
translated by 谷歌翻译